55 research outputs found
Lâapport des corpus Ă©chantillonnĂ©s aux descriptions grammaticales. Lâexemple des formes contre et entre
The following article sets out to show how different kinds of sampled corpus data can be used to provide a critical view of certain descriptions given in reference works (grammars and dictionaries) which, for French, tend to concentrate on literary usage. We show how quantitative and qualitative methods can be proposed to nuance the descriptions, using the example of the forms contre and entre in four different corpora: private speech, public speech, literature, press
Que peuvent nous apprendre en syntaxe des corpus oraux « anciens » ?
Comment peut-on sâappuyer sur des corpus oraux anciens pour dĂ©tecter certaines variations en train dâadvenir dans la morphosyntaxe du français parlĂ©Â ? Le prĂ©sent article revient sur la notion dâancien appliquĂ© Ă lâoral, et prĂ©sente quelques possibles changements dans les domaines du lexique et de la morphosyntaxe. La description sâappuie sur des enregistrements de la PhonothĂšque (1958-1979) qui sont comparĂ©s avec des corpus oraux plus rĂ©cents.How is it possible to lean on old oral corpora to identify current changes in the morphosyntax of spoken French? What does the term âoldâ mean when applied to oral corpora? What kind of work is it possible to do out of them? This article examines some potential lexical and morphosyntactic changes which appeared recently. Two kinds of corpora are used: the PhonothĂšque corpora (registered between 1958 and 1970) and some contemporary spoken corpora
Ce que lâoral nous a appris sur la syntaxe du français
Le thĂšme de ce numĂ©ro offre un bon prĂ©texte pour dresser, sur quelques points, un bilan de lâintĂ©rĂȘt de lâoral pour une meilleure connaissance de la syntaxe du français. Travailler Ă partir de donnĂ©es orales impose un certain nombre de contraintes, quâil est peut-ĂȘtre utile de rappeler (en partie du moins). Il est, par exemple, indispensable de disposer de corpus fiables : ce qui induit que leur constitution a Ă©tĂ© prĂ©parĂ©e (il ne suffit pas de collecter des donnĂ©es au hasard pour constituer u..
Comment les données de corpus pourraient renouveler les manuels de grammaire ?
Lâexploitation de grands corpus a permis de donner un Ă©clairage neuf sur de nombreux faits de langue et dâen renouveler Ă la fois lâanalyse et la prĂ©sentation. Ce constat est indĂ©niable notamment pour lâanglais, mais en ce qui concerne la langue française ces types de travaux sont encore quasi inexistants ou bien trop parcellaires. Lâobjet de cet article est de montrer comment les donnĂ©es de corpus conduisent Ă adopter un regard critique sur certaines descriptions proposĂ©es dans les grammaires ou les manuels et Ă indiquer quels amĂ©nagements pourraient ĂȘtre apportĂ©s.The use of large corpora has brought a fresh understanding of many aspects of language and has brought renewed methods of analysis and presentation. Although this is particularly true of English, for French this type of approach is typically lacking or absent even. The aim of this article is to show how corpora can help us to develop a critical account of certain descriptions given in grammar books or manuals and can help suggest changes to these
Partition et topicalisation : il y en a « stabilisateur » de sujets et de topiques indéfinis
Lâarticle traite des contraintes portant sur les pronoms indĂ©finis en position sujet. LâĂ©tude est menĂ©e Ă partir de corpus appartenant Ă divers registres. On contraste les emplois de sujets purs avec ceux oĂč lâindĂ©fini est prĂ©sentĂ© par les structures il y en a⊠qui, il y en a ⊠ils. On propose dâanalyser ces structures comme des stabilisateurs de la relation sujet. Leur effet est de libĂ©rer les indĂ©finis des contraintes microsyntaxiques qui grouvernent leur apparition en position sujet, notamment les traits sĂ©mantiques du verbe. Les deux constructions stabilisatrices ont cependant chacune leurs conditions propres dâemploi et ne constituent pas des variantes.This paper deals with the types of constraints bearing on indefinite pronouns in subject position in French. This study is based on the two distinct structures in which such pronouns appear is analysed: subject pronouns on their own versus presentative structures such as: il + V vs il y en a + indefinite pronoun + qui which appear as an alternative in subject or topic position specially in spoken spontaneous language. The factors governing the distribution of the indefinite in these different structures are listed. They include: syntactic structure (micro or macrosyntactic), type of indefinite pronoun, semantic features of the verbal predicate, discourse factors, register. It is shown that the presentative verbs function as âstabilizersâ freeing the use of indefinite pronouns from many microsyntactic constraints
Identifier et caractériser un genre: l'exemple des interviews politiques
International audienceHow to identify and define a genre : the example of political interviews This paper proposes a reflexion on the notion of genre in the context of linguistics based on a specific corpus and on the new tools this methodological approach offers. The corpus under examination is made of the oral language developed by politicians through interviews. The aim of this study is to show how to analyze such a corpus and how to answer the methodological questions raised by the seeking of the relevant morpho-syntaxical criteria which would then allow us to define a genre. From a comparative study between the initial corpus and others (oral and written), we propose to determine the linguistic factual elements directly related to some parts of these verbal productionsCet article propose une rĂ©flexion sur la notion de genre dans le cadre de la linguistique sur corpus et sur la mĂ©thodologie que ces nouveaux outils permettent d'envisager. Notre rĂ©flexion prend appui sur la langue orale des hommes politiques, Ă travers des interviews. Notre objectif est de montrer comment peut ĂȘtre abordĂ© un tel corpus et quelles questions de mĂ©thode soulĂšve la recherche de critĂšres morphosyntaxiques pertinents pour cerner un genre. A partir d'une Ă©tude comparative entre le corpus initial et d'autres corpus (de langue orale et Ă©crite), nous proposons de mieux cerner les faits de langue qui relĂšvent de certaines des composantes de ces productions
Réflexions sur les exploitations différenciées de la grammaire
Notre rĂ©flexion porte sur deux aspects en particulier : (i) les questions dâordre mĂ©thodologique qui ont trait Ă la constitution des donnĂ©es (sĂ©lection des sous-corpus, taille de ceux-ci, hiĂ©rarchie entre eux, etc.), et (ii) lâintĂ©gration dans les ouvrages de rĂ©fĂ©rence des rendements multiples de la grammaire.En nous fondant sur des corpus diversifiĂ©s, nous prĂ©sentons les rĂ©sultats de deux analyses linguistiques, lâune sur lâunitĂ© lexicale justement et lâautre sur la construction syntaxique du type il y en a (beaucoup) qui dansent. Ces deux objets dâĂ©tude illustrent pour lâun des disparitĂ©s importantes selon les corpus et pour lâautre une diffĂ©rence notable entre oral et Ă©crit. En parallĂšle, nous comparons nos analyses sur corpus avec les traitements proposĂ©s dans des grammaires et des dictionnaires.Notre recherche souligne quâune description linguistique qui prend en compte lâoral non formel donne des rĂ©sultats parfois assez diffĂ©rents de ce que lâon observe Ă lâĂ©crit, et quâil y a par consĂ©quent lieu de faire une place de choix au français parlĂ© non planifiĂ© dans les ouvrages de rĂ©fĂ©rence. Si lâĂ©tude fait ressortir la spĂ©cificitĂ© de lâoral non formel, elle ne remet toutefois pas en question lâunitĂ© du systĂšme. Les phĂ©nomĂšnes variationnels que nous avons observĂ©s ne nous conduisent pas Ă formuler une hypothĂšse de type diglossique ou dialectale, mais plutĂŽt Ă adopter une conception polylectale de la grammaireOur reflection focuses on two aspects: (i) methodological issues related to the creation of data (selection of sub-corpora, size of sub-corpora, hierarchy among them, etc.), and (ii) the integration of the multiple usages of the grammar in reference books.Based on diversified French corpora, we prĂ©sent the results of two linguistic analyzes - one on the lexical unit justement (âpreciselyâ) and the other on syntactic constructions like il y en a (beaucoup) qui dansent (âthere are many people who danceâ). These two subjects of research illustrate important disparities according to the corpus for one and a significant difference between spoken and written French for the other. In parallel, we compare our corpus studies with the corresponding items in both grammars and dictionaries.Our study emphasizes that a linguistic description taking into account non- formal oral gives results that are sometimes quite different from what is observed in writing. So it is necessary to integrate unplanned spoken French in the reference grammars. Even if our work highlights the specificity of non-formal oral, we think that the system is unique. The facts we have observed do not lead us to formulate a âdiglossicâ or âdialectalâ hypothesis, but rather to adopt a âpolylectalâ conception of grammar
Les incidences de quelques aspects de la transcription outillée
Cet article sâinscrit dans une rĂ©flexion dâabord mĂ©thodologique (mais en montrant les consĂ©quences thĂ©oriques des choix faits lors de ces Ă©tapes) sur les premiers moments du travail sur les corpus, Ă partir de la sĂ©lection dâun logiciel dâaide Ă la transcription. Lâinterrogation majeure porte sur les enjeux et les incidences de ce que chacun des logiciels, par ses fonctionnalitĂ©s propres, donne Ă voir du fonctionnement de lâoral, ou au contraire ne permet pas de montrer. Avec quelques exemples provenant dâun corpus recueilli en rĂ©gion parisienne, autour du discours rapportĂ©, des particules et des chevauchements, lâobjectif ultime est de montrer que cette phase initiale engage dĂ©jĂ toute une conception de la langue.This article discusses some methodological considerations which need to be adressed during the initial stages of corpus analysis, when selecting a transcription tool, in order to highlight the theoretical consequences of the choices made at this stage. The main focus of the article concerns the issues and implications of what different software tools, by virtue of their specific characteristics, reveal or on the contrary do not reveal about the way speech operates. The analysis is illustrated by examples drawn from a corpus of Parisian French around features such as reported speech, particles, and overlaps. It is argued that this initial stage already involves an entire conception of the language
Spoken Corpora Good Practice Guide 2006
International audienceThere is currently a vast amount of fundamental or applied research, which is based on the exploitation of oral corpora (organized recorded collections of oral and multimodal language productions). Created as a result of linguists becoming aware of the importance to ensure the durability of sources and a diversified access to the oral documents they produce, this Guide to good practice mainly deals with âoral corporaâ, created for and used by linguists. But the questions raised by the creation and documentary exploitation of these corpora can be found in numerous disciplines: ethnology, anthropology, sociology, psychology, demography, oral history notably use oral surveys, testimonies, interviews, life stories. Based on a linguistic approach, this Guide also touches on the preoccupations of other researchers who use oral corpora (for example in the field of speech synthesis and recognition), even if their specific needs arenât consistently dealt with in the present document
Corpus oraux, Guide des bonnes pratiques 2006. Version allemande
International audienceViele Grundlagen- oder angewandte Forschungen beruhen zur Zeit auf der Auswertung von âKorpora der gesprochenen Spracheâ (geordneten Sammelwerken der Aufnahmen von mĂŒndlichen und multimodalen sprachlichen Produktionen). Dieses Handbuch der guten Praktiken entsteht aus der Erkenntnis von Sprachwissenschaftlern, die darauf bedacht sind, den Fortbestand der Quellen und einen verschiedenartigen Zugang zu den mĂŒndlichen von ihnen produzierten Produktionen zu sichern ; es schneidet zuerst die âKorpora der gesprochenen Spracheâ an, die von Sprachwissenschaftlern und fĂŒr sie geschaffen und verwendet wurden. Die durch die Erschaffung und die dokumentarische Auswertung dieser Korpora hervorgerufenen Fragen trifft man aber in vielen FĂ€chern : die Völkerkunde, die Anthropologie, die Soziologie, die Psychologie, die Demographie, die mĂŒndlich ĂŒberlieferte Geschichte gebrauchen vor allem die verbale Befragung, die Aussage, das Interview, die Lebensgeschichte. Dieses Handbuch beruft sich auf das Verfahren der Sprachwissenschaftler, es stimmt aber mit den BeschĂ€ftigungen anderer Forscher ĂŒberein, die Korpora der gesprochenen Sprache (z. B. in Sprachsynthese und -entzifferung) gebrauchen, auch wenn ihre spezifischen BedĂŒrfnisse im vorliegenden Dokument nicht systematisch angeschnitten werden
- âŠ